关联分析
Apriori
要根据事务确认k-频繁项集扫好多次DB,效率太低了!怎么办?怎么加速?
找强关联规则
找频繁项集
HASH TREE
构造哈希树:选择散列函数(理论上取啥都可以,不过最好取3)
支持度计算:传入事务,不断散列,散列到基层使用对比确认每个频繁项集的支持度
生成关联规则的剪枝原理
例题